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Prufungsantrag gem. 5 44 PatG ist gestellt 
(g) Datenverarbeitungseinrichtung 

(57) In Verbinduno mit einer Datenverarbeitungseinrichtung, 
wobei ein (im folgenden DatenfluSprozessor - DFP - genann- 
ter) integrierter Schaltungskreis (Chip) mit einer Vielzahl 
insbesondere orthogonal zueinanderangeordneter homogen 
strukturierter Zellen mit je einer Mehrzahl jeweils logisch 
gleicher und strukturell identisch angeordneter Bausteine 
vorgesehen ist, dessen Zellen zeilen- und spaltenweise, 
gegebenenfalls gruppenwetee zusammengefaRt, mit Ein- 
/Ausgengsanschlussen des integrierten Schaltkreises ver- 
bunden sind. ist erf indungsgemaB den Zellen eine Ladelogik 
zugeordnet. uber die sie je fOr sich und gegebenenfalls 
gruppenwefse zusammengefaBt so prog ram mierbar (konfi- 
gurierbar) sind, dafi beliebige logische Funktionen und/oder 
Varnetzungen untereinander verifizierbar sind, und zwar 
derart, daB eine Manipulation der DFP-Konfiguration wan- 
" rend des Betriebes (oder zur Laufzeit), d. h. die Modifikation 
f f unktioneiler Teile (MACROS) des DFPs erfolgen kann, ohne 
* daS andere funktionelle Teile angehalten warden mussen 
- Oder in ihrer Funktion beeintrachtigt werden. 
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Beschreibung Diese Aufgabe wird dadurch gelost, daB ein integrier- 

ter Schaltkreis (Chip) mit einer Vielzahl insbesondere 
Die vorliegende Erfindung bezieht sich auf cine Da- orthogonal zueinander angeordneter Zellen mit je einer 
tenverarbeitungseinrichtung, d. h. eine Hardwareeinheit Mehrzahl jeweils logisch gleicher und strukturell iden- 
zur logischen Manipulation (VerknQpfung) von in binS- 5 tisch angeordneter Zellen vorgesehen ist deren Anord- 
rer Form vorliegenden Daten (Informationen). nung, sowie die interne Busstruktur, zur Erleichterung 

Derartige Datenverarbeitungseinrichtungen sind der Programmierung auBerst homogen ist Dennoch ist 
mittlerweile lange bekannt und sie haben bereits breite es denkbar innerhalb eines DatenfluBprozessors Zellen 
Anwendung und Anerkennung gefunden. Die prinzipiel- mit verschiedenen Zellogiken und Zellstrukturen unter- 
le Aufbau- und Arbeitsstruktur der bekannten Daten- 10 zubringen, um so die Leistungsfahigkeit zu erhohen, in- 
verarbeitungseinrichtungen ist in erwa so zu definieren, dem zum Beispiel fQr Speicheransteuerungen andere 
daB eine arithmetisch-logische VerknQpfungseinheit Zellen als fflr arithmetische Operationen exisueren. Ins- 
vorgesehen ist, in der die zu verknflpfenden Daten einer besondere kann fur neuronale Netze eine gewisse Spe- 
programmtechnischen Anweisung (Software) zufolge zialisierung von Vorteil sein. Den Zellen ist eine Ladelo- 
verarbeitet werden. Die Daten werden dabei ttber ein 15 gik zugeordnet, Qber die die Zellen je fQr sich und gege- 
Steuerwerk in mehr oder weniger komplexen Adressie- benenfalls gruppenweise in sogenannte MACROs zu- 
rungsvorgangen entsprechend abgerufen und zunachst sammengefafit so programmierbar sind, daB einerseits 
in Arbeitsregistern bereitgestellt; nach der logischen beliebige Iogische Funktionen, andererseits aber auch 
VerknQpfung werden dann die neuen Daten in einer die Verknttpfung der Zellen untereinander in weiten 
vorgegebenen Speicherstelle wieder abgelegt Die 20 Bereichen verifizierbar sind. Dies wird erreicht indem 
arithmetisch-logische VcrknGpfungseinheit besteht da- jeder einzelnen Zelle ein gewisser Speicherplatz zur 
bei aus logischen VerknQpfungsbausteinen (Gatter, VerfQgung stent, in dem die Konfigurationsdaten abge- 
Glieder), die jeweils so miteinander gekoppeit sind, daB legt sind. Anhand dieser Daten werden Multiplexer oder 
die zu manipulierenden Daten der zugrunde liegenden Transistoren in der Zelle beschaltet um die jeweilige 
Software entsprechend den vier Grundrechenarten ge- 25 Zellfunktion zu gewahrleisten (siehe Fig. 12). 
maB logisch verarbeitet werden. Mit anderen als im Patemanspruch 1 gebrauchten 

Es ist leicht nachzuvollziehen, daB auf der Basis der Worten besteht der Kern der vorliegenden Erfindung 
bekannten Strukturen relativ viel Rechenzeit dafflr er- darin, einen DatenfluBprozessor vorzuschlagen, der zel- 
forderlich ist, die zu manipulierenden Daten auszulesen, lular aufgebaut ist und dessen Zellen Qber eine externe 
und die Arbeitsregister zu QberfQhren, den spezifischen 30 Ladelogik im arithmetisch-logischen Sinne quasi belie- 
Logikbausteinen in der arithmetisch-logischen Ver- big neu konfiguriert werden kdnnen. Dabei ist es von 
knUpfungseinheit zuzuleiten und schlieBlich wieder ab- auBerster Notwendigkeit, daB die betreffenden Zeilen 
zuspeichern. Es ist ferner einsichtig, daB die Hardware- einzeln und ohne Beeinflussung der Qbrigen Zeilen oder 
Struktur der arithmetisch-logischen VerknQpfungsein- gar einer Stiliegung des gesamten Bausteins umkonfigu- 
heit insoweit nicht als optimal betrachtet werden kann. 35 riert werden kdnnen. Der DatenfluBprozessor gemftB 
als schlieBlich die hardwaremaBig vorhandenen inte- der vorliegenden Erfindung kann so wahrend eines er- 
grierten logischen Bausteine stets nur in ein und dersel- sten Arbeitszyklus als Addierer und wahrend eines sp3- 
ben Art und Weise im Gesamtsystem aktiv benutzt wer- teren Arbeitszyklus als Multiplizierer "programmiert" 
den. Ebenso wird durch strikte Hardwarevorgabe ein werden, wobei die Anzahl der fQr die Addition bezie- 
Aneinanderreihen von Funktionen in sogenannten Pipe- 40 hungsweise die Multiplikation erforderlichen Zellen 
lines sehr erschwert oder eingeschrankt, was zwangs- durchaus unterschiedlich sein kdnnen. Dabei bleibt die 
laufig ein haufiges Registerumladen zwischen Arbeits- Plazierung der bereits geladenen MACROs erhalten; 
registern und Rechenwerk bedeutet Derartige Baustei- der Ladelogik beziehungsweise dem Compiler obliegt 
ne sind des weiteren nur schlecht kaskadierbar und er- es, das neu zu ladende MACRO innerhalb der freien 
fordera dann sehr viel Programmierarbeit 45 Zellen zu partitionieren (d.h. das zu ladende MACRO 

Ein zusatzlicher Vorteil der vorliegenden Erfindung so zu zerlegen, daB es sich opdmai einfQgen laBt). Die 
liegt darin, daB eine Qber einen weiten Raum skalierbare Ablaufsteuerung des Programms wird dabei von der 
Parallelitat zur VerfQgung steht Hierbei wird eine Basis Ladelogik ubernommen, indem sie gemSB dem momen- 
zum schnellen und flexiblen Aufbau von neuronalen tan ausgeftthrten Programmabschnitt die entsprechen- 
Strukturen geschaffen, wie die bis dato lediglich mit 50 den MACROs in den Baustein ladt, wobei der Ladevor- 
erheblichem Aufwand simuliert werden kdnnen gang von der spater beschriebenen Synchronisationslo- 

Die der vorliegenden Erfindung zugrunde liegende gik mitgesteuert wird, indem sie den Zeitpunkt des Um- 
Aufgabe besteht darin, eine im folgenden DatenfluBpro- ladens fesdegt Daher entspricht der DFP nicht der be- 
zessor (DFP) genannte Datenverarbeitungseinrichtung kannten von-Neumann-Architektur, da die Daten- und 
anzugeben, bei der eine hdhere beziehungsweise besse- 55 Programmspeicher getrennt sind Dies bedeutet jedoch 
re Flexibilitat der Gesamtstruktur und des Datenflusses gleichzeitig eine hdhere Sicherheit, da fehlerhafte Pro- 
sowie der Pipelining- und Kaskadiermdglichkeiten zu gramme keinen CODE, sondern lediglich DATEN zer- 
einer ErhOhung der Rechnerbeziehungsweise VerknQp- storen kdnnen. 

fungsleistung fQhrt Um den DatenfluBprozessor eine arbeitsfahige Struk- 

AuBer dem Einsatz als reiner DatenfluBprozessor, 60 tur zu geben, werden einige Zellen, und zwar unter an- 
soll der DFP folgende weitere Aufgaben erfullen kon- derem die Eingabe-/Ausgabefunktionen (I/O) und Spei- 
nen: chermanagementfunktionen vor dem Laden der Pro- 

gramme geladen und bleiben fQr gewdhnlich wahrend 

— Einsatz als universeller Baustein zum Aufbau der gesamten Laufzeit konstant Dies ist erf orderlich um 
von herkammlichen Rechnern, wobei der Aufbau 65 den DatenfluBprozessor an seine Hardwareumgebung 
einfacher und billiger werden solL anzupassen. Die Qbrigen Zellen werden zu sogenannten 

— Einsatz in neuronalen Netzen. MACROs zusammengefaflt und konnen wahrend der 

Laufzeit nahezu beliebig und ohne Beeinflussung der 
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Nachbarzellen umkonfiguriert werden. Dazu sind die 
Zellcn einzeln und direkt adressierbar. 

Um die Umstrukturierung (das Umladen) der Zellen 
oder MACROs mit der Ladelogik zu synchronisieren, 
kann — wo notwendig, da nur Umgeladen werden darf f 
wenn die MACROs mit ihrer alten Tatigkeit fertig sind 
- eine Synchronisauonsschaltung ais MACRO auf dem 
DatenfluBprozessor untergebracht werden, die die ent- 
sprechenden Signale an die Ladelogik absendet Hierzu 
kann eventuell eine Modifikation der gewdhnlichen 
MACROs von N6ten sein, da diese dann der Synchroni- 
sations-Schaltung Zustandsinformationen zur Verfii- 
gung stellen mussen. 

Diese Zustandsinformationen signalisieren der Syn- 
chronisationslogik fur gewQhnlich, daB einzelne MA- 
CROs ihre Aufgabe erledigt haben, was aus program- 
miertechnischer Sicht zum Beispiei die Terminierung 
einer Prozedur oder das Erreichen der Terrainierungs- 
bedingung einer Schleife bedeuten kann. DJt das Pro- 
gramm wird an einer anderen Stelie fortgesetzt und die 
die Zustandsinformation absendenden MACROs kon- 
nen umgeladen werden. Zudem kann es von Interesse 
sein, daB die MACROs in einer bestimmten Reihenfolge 
umgeladen werden. Hierzu kann eine Wertung der ein- 
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a) Nur die lokalen Verbindungen zwischen den Zel- 
len werden herausgeftthrt, was im vorliegenden 
Beispiei zwei I0-Pins pro Kantenzelle und vier IO- 
Pins pro Eckzelle bedeutet. AUerdings hat der 
Compiler/Programmierer zu beachten, dafl die gio- 
balen Verbindungen nicht herausgefuhrt werden, 
wodurch die Kaskadierung nicht vollstandig homo- 
gen ist (Globale Verbindungen zwischen mehreren 
Zellen, fur gewflhnlich zwischen einer kompletten 
Zellenreihe oder -spaite - siehe Fig* 6 — ; lokaie 
Verbindungen existieren nur zwischen zwei Zellen). 
Fig. 16a zeigt den Aufbau innerhalb eines DFPs, 
Fig, 17a zeigt die daraus resultierende Kaskadie- 
rung von mehreren DFPs(drei gezeichnetji 

b) Die lokalen und globalen Verbindungen werden 
herausgeftthrt, was die Anzahl der bendtigten Trei- 
ber/IO-Pins und Leitungen drastisch erhdht, in un- 
serecn Beispiei auf sechs IO-Pins pro Kantenzelle 
und zw5if IO-Pins pro Eckzelle. Dadurch ist eine 
vollstandige Homogenitat bei der Kaskadierung 
gegeben. 



Da die globalen Verbindungen insbesondere bei Ver- 

umgeiaaen weraen. mcrzu num cm* w B ^ wendung der Kaskadierungstechnik b) sehr lang wer- 

zelnen Synchronisations-Signale durch einen Prioritats- 25 den kdnnen, kann der unangenehme Effekt auftreten, 

dekoder erfolgen. Eine derartige - einfache - Logik dafi die Zahl der globalen Verbindungen nicht ausreicht. 

ist in Fig 13 gezeichnet Die Logik besitzt sieben Ein- da bekanntlich jede Verbindung nur von einem Signal 

gangssignale durch die die sieben MACROs ihre Zu- genutzt werden kann. Um diesen Effekt zu minimieren, 

standsinformation abgeben. In diesem Fall soil 0 far "in kann nach einer gewissen Lange der globalen Verbin- 

Arbeit" und 1 fur "fertig" stehen. Die Logik besitzt drei 30 dungen ein Treiber eingeschleift werden. Der Treiber 

Ausgangssignale, die an die Ladelogik gef uhrt werden, hat zum einen eine Verstarkung des Signals zur Aufga- 

wobei der Zustand 000 als Ruhezustand gilt Liegt ein be, die bei langen Strecken und entsprechend hohen 

Signal an einem der sieben Eingange an, so findet eine Lasten, unbedingt erforderlich ist; zum anderen kann 

Deamal-Binar-Umsetzung statt, so wird zum Beispiei der Treiber in Tristate gehen und damit das Signal un- 

Sync6 als 1 10 dargesteilt, was der Ladelogik anzeigt, daB 35 terbrechen. Dadurch konnen die Abschnitte links und 

das MACRO, welches Sync6 bedient, seine Aufgabe be- rechts, beziehungsweise oberhalb und unterhalb des 

endet hat Liegen gleichzeitig mehrere Synchronisa- Treibers von verschiedenen Signalen genutzt werden, 

tions-Signale am Eingang an, so gibt die Synchronisa- sofern der Treiber in Tristate ist, ansonsten wird ein 

tionsschaltung das Signal mit der hochsten Prioritat an Signal durchgeschleift Wichtig ist hierbei, daB die Trei- 

die Ladelogik weiter; liegen zum Beispiei SyncO, Sync4 40 ber der einzelnen globalen Leitungen auch einzeln an- 



und SyncG an, so reicht die Syncronistaions-Schaltung 
zun&chst Sync6 an die Ladelogik weiter. Nachdem die 
entsprechenden MACROs umgeladen sind und somit 
Sync6 nicht mehr anliegt wird Sync4 weitergeleitet usw. 
Zur Verdeutlichung dieses Prinzips kann der Standard- 
TTL-Baustein 74148 in Betracht gezogen werden. 

Ober die Ladelogik kann der DatenfluBprozessor je- 
weils optimal und gegebenenfalls dynamisch auf eine zu 
ldsende Aufgabe eingestellt werden. Damit ist zum Bei 



gesteuert werden kdnnen, d. h. ein globales Signal kann 
unterbrochen sein, das Nachbarsignal ist jedoch durch- 
geschleift. Somit k6nnen auf einer globalen Verbindung 
durchaus abschnittweise verschiedene Signale anliegen, 
45 wahrend die globale Nachbarverbindung tatsachlich 
global von ein und demselben Signal verwendet wird 
(vergleicheFig.22). 

Zur besseren Kommunikation zwischen den Daten- 
fluBprozessoren und der Ladelogik konnen sogenannte 
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spiel der grofle Vorteil verbunden, daB neue Normen 50 Shared-Memories eingesetzt werden. So kdnnen zum 



oder dergleichen einzig und allein durch eine Umpro 
grammierung des DatenfluBprozessors umgesetzt wer- 
den kdnnen und nicht — wie bisher — einen Austausch 
mit entsprechendem Anfall von Elektronikschrott be- 
dingen. 

Die DatenfluBprozessoren sind untereinander kaska- 
dierbar, was zu einer beinahe beliebigen Erhdhung des 
Parallelisierungsgrades, der Rechenleistung, sowie der 
NetzgrdBe in neuronalen Netzen fiihrt. Besonders wich- 
tig ist hier eine klare homogene Verbindung der Zellen 
mit den Ein-/Ausgangs-Pins (10-Pin) der DatenfluBpro- 
zessoren, um rndglichst keine Einschrankungen auf die 
Programme zu haben. 

In Fig. 14 ist zum Beispiei die Kaskadierung von vier 



Beispiei Programme von einer Festplatte, die im IO-Be- 
reich eines DatenfluBprozessors liegt zur Ladelogik 
durchgereicht werden, indem die DatenfluBprozessoren 
die Daten von der Platte in den Shared-Memory schrei- 
55 ben und die Ladelogik sie dort abholt. Dies ist besonders 
wichtig, da hier, wie bereits erwahnt, keine von-Neu- 
mann- sondern eine Harvardarchitektur vorliegt Eben- 
so sind die Shared-Memories von Vorteil, wenn Kon- 
stanten, die im Programm — das im Speicherbereich der 
60 Ladelogik liegt — definiert sind, mit Daten — die im 
Speicherbetrieb der DatenfluBprozessoren liegen — 
verknupft werden sollen. 

Weiterbildungen der vorstehend deflnierten und um- 
schriebenen Erfindung sind Gegenstand der Unteran- 



DFPs gezeigt. Sie erscheinen der Umgebung wie ein 65 sprQche. 
groBer homogener Baustein (Fig. 15). Prinzipiell sind Eine besondere Verwendung des erfiiidungsgemaBen 
damit zwei Kaskadierungsmethoden denkbar: DatenfluBprozessors ist dann zu sehen, daB er in Ver- 

bindung mit geeigneten Ein-/Ausgabe-&nneiten emer- 
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seits und einem Speicher andererseits die Basis fur einen 
kompletten (komplexen) Rechner bilden kann. Dabei 
kann ein GroBteil der IO-Funktionen als MACROs auf 
dem DatenfluBprozessor implementiert werden und es 
brauchen momentan ledigtich Spezialbausteine (Ether- 
net-Treiber, VRAMS ... ) extern zugefQgt zu werden. 
Bei einer Normanderung oder Verbesserung muB dann 
wie bereits angedeutet nur das MACRO softwareseitig 
gewechselt werden; ein Eingriff in die Hardware ist 
nicht notwendig. Es bietet sich hier an, einen IO-(Einga- 
be-/Ausgabe-) Stecker festzulegen, tiber welchen dann 
die Zusatzbausteine angeschlossen werden kdnnen. 

Fig* 20 zeigt den stark vereinfachten Aufbau eines 
heute Ublichen Rechners. Durch den Einsatz eines DFP- 
Bausteins kdnnen erhebliche Teile eingespart werden 
(Fig. 21), wobei die entsprechenden herkdmmlichen 
Baugruppen (CPU, Speicherverwaltung, SCSI-, Tasta- 
tur- und Videointerf ace, sowie der parallelen und seriel- 
len Schnittstellen) als MACROs in die kaskadierten 
DFPs abgelegt werden. Nur die durch einen DFP nicht 
nachbildbaren Teile wie Speicher und Leitungstreiber 
mit nicht TTL-Pegeln oder fQr hohe Lasten mttssen ex- 
tern zugeschaltet werden. Durch die Verwendung des 
DFPs ist eine gQnstige Produktion gegeben, da ein und 
derselbe Baustein sehr haufig verwendet wird, das Lay- 
out der Platine ist durch die homogene Vernetzung ent- 
sprechend einfach. Zudem wird der Aufbau des Rech- 
ners durch die Ladelogik bestimmt, die hier fur gewdhn- 
lich nur zu Beginn der Abarbeitung (nach einem Reset) 
das DFP-Array l&dt, wodurch eine gunstige Fehlerkor- 
rektur- und Erweiterungsm6glichkeit gegeben ist Ein 
derartiger Rechner kann insbesondere mehrere ver- 
schiedene Rechnerstrukturen simulieren, indem einfach 
der Aufbau des zu simulierenden Rechners in das DFP- 
Array geladen wird. Zu bemerken ist, daB hierbei der 
DFP nicht in seiner Funktion als DFP arbeitet sondern 
lediglich ein hochkomplexes und frei programmierbares 
Logikarray zur VerfQgung stellt, sich hierbei jedoch von 
herkdmmlichen Bausteinen in seiner besonderen guten 
Kaskadierbarkeit unterscheidet 

Ein weiteres Einsatzgebiet des Bausteins ist der Auf- 
bau grofler neuronaler Netze. Sein besonderer Vorzug 
Hegt hierbei in seiner hohen Gatterdichte, seiner ausge- 
zeichneten Kaskadierbarkeit, sowie seiner Horaogeni- 
t&t Ein Lernvorgang, der eine Anderung einzelner axio- 
matischer Verbindungen beziehungsweise einzelner 
Zellfunktionen beinhaltet ist auf Qblichen Bausteinen 
ebenso schtecht durchfiihrbar, wie der Aufbau groBer 
homogener und gleichzeitig flexibler Zellstrukturen. 
Die dynamische Umkonfigurierbarkeit ermftglicht erst- 
malig die optimale Simulation von Lernvorgangen. 

Die vorliegende Erfindung wird im folgenden anhand 
der weiteren Figuren naMier erlftutert Insgesamt zeigen 

Fig. 1 ein Schaltsymbol fUr einen 8-Bit- Addierer; 

Fig. 2 ein Schaltsymbol fur einen aus acht 1-Bit-Ad- 
dierem bestehenden 8-Bit-Addierer nach Fig. 1 ; 

Fig. 3 eine Iogische Struktur eines 1-Bit-Addierers 
entsprechend Fig. 2; 

Fig. 4 eine Zellenstruktur des 1-Bit-Addierers ent- 
sprechend Fig. 3; 

Fig. 5 einen der Zellenstruktur nach Fig, 1 entspre- 
chend auf gebauten 8-Bit-Addierer; 

Fig. 6 ein aus vier Zellen bestehendes unprogram- 
miertes SUBMACRO X (analog einem 1 -Bit- Addierer 
gemaB Fig. 4 beziehungsweise Fig. 5) mit den erforder- 
lichen Leitungsanschlussen; 

Fig. 7 einen Teilausschnitt eines integrierten Schalt- 
kreises (Chip) mit einer Vielzahl von Zellen und einem 



separierten SUBMACRO X gem&B Kg. 6; 

Fig. 8 einen integrierten Schaltkreis (Chip) mit einer 
Orthogonalstruktur einer quasi beliebigen Vielzahl von 
Zellen und einer extern zugeordneten Ladelogik; 
5 Fig. 9 ein erstes Ausfuhrungsbeispiel einer Mehrzahl 
miteinander zu einem Rechenwerk gekoppelter inte- 
grierter Schaltkreise (DatenfluBprozessor) nach Fig. 8; 

Fig. 10 ein zweites Ausfuhrungsbeispiel einer Mehr- 
zahl miteinander zu einem Rechenwerk gekoppelter in- 
to tegrierter Schaltkreise (DatenfluBprozessor) nach 
Fig. 8; 

Fig. 1 1 ein Ausfuhrungsbeispiel eines MACRO zur 
Addition zweier Zahlenreihen; 

Fig. 12 einen beispielhaften Aufbau einer Zelle mit 
is Multiplexern zur Auswahl der jeweiligen logischen Bau- 
steine; 

Fig. 13 eine zum Beispiel mit einem Standard-TTL- 
Baustein 74148 ausgefiihrte Synchronisationslogik; 

Fig. 14 die Kaskadierung von vier DFPs, wobei die 
20 Verbindung zwischen den IO-Pins nur schematisch dar- 
gestellt sind (tatsichlich bedeutet eine gczeichnete Ver- 
bindung eine Mehrzahl von Leitungen); 

Fig. 15 die durch die Kaskadierung erreichte Homo- 
genit&t; 

25 Fig. 1 6a die Struktur der E/A-Zellen, wobei die globa- 
len Verbindungen nicht herausgefOhrt werden, 

Fig. 16b die Struktur der E/A-Zellen, jedoch mit her- 
ausgefuhrten globalen Verbindungen; 
Fig. 17a die aus Fig. 16a resultierende Kaskadierung, 
30 wobei eine Eckzelle, sowie die zwei mit ihr kommunizie- 
renden Treiberzellen der kaskadierten Bausteine (ver- 
gleiche hierzu Fig. 14) gezeichnet sind; 

Fig. 17b die aus Fig. 16b resultierende Kaskadierung, 
wobei eine Eckzelle, sowie die zwei mit ihr kommunizie- 
35 renden Treiberzellen der kaskadierten Bausteine (ver- 
gleiche hierzu Fig. 14) gezeichnet sind; 

Fig. 18a eine Multiplikationsschaltung (vergleiche 
Fig. 11a); 

Fig. 18b die interne Struktur des DFPs nach dem La- 
40 den (vergleiche Fig. U b); 

Fig. 19c die Arbeitsweise des DFPs im Speicher, so- 
wie die Zustande der ZShler 47, 49; 

Fig. 19 eine Kaskadenschaltung, wobei der Addierer 
aus Fig. 1 1 und der Multiplizierer aus Fig. 18 zur Steige- 
45 rung der Rechenleistung hintereinander geschaltet sind; 

Fig. 20 den stark schematisierten Aufbau eines her- 
kdmmlichen Rechners; 

Fig. 21 den mdglichen Aufbau desselben Rechners 
mit Hilfe eines Arrays aus kaskadierten DFPs; 
so Fig. 22 einen Ausschnitt mit eingezeichneten (Lei- 
tungs-)Treibern eines DFPs. 

In Fig. 1 ist ein Schaltsymbol eines 8-Bit-Addierers 
dargestellt Das Schaltsymbol besteht aus einem qua- 
dratischen Baustein 1 mit acht Eingangen A 0 ... 7 fur 
55 ein erstes Datenwort A und acht Eingangen B 0 ... 7 far 
ein zweites (zu addierendes) Datenwort B. Die jeweils 
acht Eingange Ai. Bi werden erganzt durch einen weite- 
ren Eingang Oein fiber den dem Baustein 1 gegebenen- 
falls ein Obertrag zugeleitet wird. Der Baustein 1 hat 
60 funktions- und besummungsgemaB acht Ausgange S 0 
... 7 fur binfiren Summanden und einen weiteren Aus- 
gang Oaus fur den gegebenenfalls bestehenden Ober- 
trag. 

Das in Fig. 1 dargestellte Schaltsymbol ist in Fig. 2 als 
65 Anordnung sogenannter SUBMACROS dargestellt 
Diese SUBMACROS 2 bestehen je aus einem 1-Bit-Ad- 
dierer 3 mit je einem Eingang fttr die entsprechenden 
Bits des Datenworts und einem weiteren Eingang fttr ein 
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Obertragsbit Die 1-Bit-Addierer 3 weisen daruberhin- Fig. 4) bestehende Untereinheit zu betrachten ist 
aus einen Ausgang fur den Summanden und einen Aus- Das in Fig. 5 separierte SUBMACRO "X" ist in Fig. 6 
gang fur den Obertrag Oaus auf. als Teil eines integrierten Schaltkreises (Chip) 20 ge- 

In Fig. 3 ist die binare Logik eines 1-Bit-Addierers meinsam mit Leitungs- und Datenanschlfissen darge- 
beziehungsweise eines SUBMACROS 2 nach Fig. 2 dar- 5 stellt Das SUBMACRO "X" besteht aus den vier Zellen 
gestellt Analog zu Fig. 2 weist diese SchaltiogUc je ei- 10 die entsprechend der orthogonalen Struktur je Seite 
nen Eingang Ai, Bi fOr die konjugierten Bits der zu vier Datenanschlusse (also insgesamt sechzehn Daten- 
verknupfenden Daten auf; ferner ist ein Eingang Oein anschliisse je Zelle) aufweisen. Die Datenanschlusse 
fiir den Obertrag vorgesehen. Diese Bits werden den verbindenjeweils benachbarte Zellen, so daB ersichthch 
dargestellten Verbindungen beziehungsweise Verknfip- to wird wie beispielsweise eine Dateneinheit von Zelle zu 
fungen entsprechend in zwei ODER-Gliedem 5 und drei Zelle durchgeschleust wird Die Ansteuerung der Zellen 
NAND-Gliedern 6 verknfipft, so daB am Ausgangsan- 10 erfolgt einerseits fiber sogenannte lokale Steuerun- 
schlufl Si und am Ausgang fiir den Obertrag Uaus die gen, das sind lokale Leitungen, die mit alien Zellen ver- 
einem Volladdierer entsprechenden VerknQpfungser- bunden sind, und andererseits fiber sogenannte globale 
gebnisse (Si, Oaus) anstehen. 15 Leitungen, d h. Leitungen, die Qber den gesamten inte- 

Die Erfindung setzt da ein, wo es — wie in Fig. 4 grierten Schaltkreis (Chip) 20 geftthrt sind 
dargestellt - darum geht, das in Fig- 3 gezeigte SUB- In Fig. 7 ist ein vergrdBerter Ausschnitt eines inte- 
MACRO 2 oder eine oder mehrere beliebige Funk- grierten Schaltkreises 20 dargestellt, der mit einem or- 
tion(en) in geeigneter Weise in einer Zellstruktur zu thogonalen Raster von Zellen 10 belegt ist Wie in Fig. 7 
implementieren. Dies geschieht auf der Grundlage lo- 20 angedeutet kann so zum Beispiel eine Gruppe von vier 
gisch und strukturell identischer Zellen 10, dereneinzel- Zellen 10 als SUBMACRO "X" ausgewahlt und detn 
ne logische Bausteine der auszufOhrenden VerknQp- 1-Bit-Addierer entsprechend Fig. 4 gemaB program- 
fungsfunktion entsprechend miteinander gekoppelt miert beziehungsweise konfiguriert werden. 
werden, und zwar mittels der noch zu beschreibenden Ein vollstandiger integrierter Schaltkreis (Chip) 20 ist 
Ladelogik. GemaB der in Fig. 4 gezeigten, von der 25 in Fig. 8 dargestellt. Dieser integrierte Schaltkreis 20 
Schaltlogik nach Fig. 3 abgeleiteten Verkntipfungslogik besteht aus einer Vielzahl im orthogonalen Raster ange- 
fur einen 1-Bit-Addierer sind je zwei Zellen 10.1, 10.2 ordneter Zellen 10 und weist an seinen AuBenkanten 
bezfiglich der logischen Bausteine insoweit gleich, daB eine entsprechende Anzahl von LeitungsanschlQssen 
jeweils ein ODER-Glied 5 und ein NAND-Glied 6 akti- (Pins) auf, ttber die Signale, insbesondere Ansteuersi- 
viert sind Eine dritte Zelle 103 wird nur als Leitungszel- 30 gnale und Daten zugefQhrt und weitergeleitet werden 
le (Leiterbahnzelle) benutzt und die vierte Zelle 10.4 ist kfinnen. In Fig. 8 ist wiederum das SUBMACRO "X" 
bezfiglich des dritten NAND-Gliedes 6 aktiv geschaltet gemaB F!g.5/Fig.6 abgegrenzt; darfiberhinaus sind 
Das aus den vier Zellen 10.1 . . . 10.4 bestehende SUB- audi weitere SUBMACROS separiert, die spezifischen 
MACRO 2 steht somit stellvertretend ffir einen 1-Bit- Funktionen und Vernetzungen entsprechend zu Unte- 
Addierer, dh. ein 1-Bit-Addierer einer Datenverarbei- 35 reinheiten zusammengefaBt sind. Dem integrierten 
tungseinrichtung gemaB der vorliegenden Erfindung Schaltkreis (Chip) 20 ist eine Ladelogik 30 zugeordnet 
wird Uber vier entsprechend programmierte (konfigu- beziehungsweise fibergeordnet, fiber die der integrierte 
rierte) Zellen 10.1 . . . 10.4 verifiziert. (Der Vollstandig- Schaltkreis 20 programmiert und konfiguriert wird Die 
keit halber soli angemerkt werdea daB die einzelnen Ladelogik 30 teilt letztlich dem integrierten Schaltkreis 
Zellen ein erheblich umfangreicheres Netzwerk von lo- 40 20 mit, wie er arithmetisch-logisch zu arbeiten hat Be- 
gischen Bausteinen, sprich Verknfipfungsgliedern, und zugnehmend auf die Fig. 1 bis 5 ist in Fig. 8 einerseits 
Invertern aufweist, die jeweils dem aktuellen Befehl der das SUBMACRO "X" entsprechend Fig. 4 und Fig. 5 
Ladelogik zufolge aktiv geschaitet werden kdnnea Ne- hervorgehoben; andererseits ist auch ein MACRO °Y" 
ben den logischen Bausteinen ist auch ein dichtes Netz entsprechend Fig. 1 und Fig. 2 angezeichnet, das als Ein- 
von Verbindungsleitungen zwischen den jeweils be- 45 heit einem 8-Bit- Addierer entspricht 
nachbarten Bausteinen und zum Aufbau von zeilen- und Anhand von Fig. 9 beziehungsweise Fig. 10 soli im 
spaltenweisen Busstrukturen zur DatenQbertragung an- folgenden eine Rechnerstruktur beschrieben werden, 
dererseits vorgesehen, so daB Qber eine entsprechende die auf den im vorstehenden defmierten und erlauterten 
Programmierung seitens der Ladelogik quasi beliebige integrierten Schaltkreis 20 auf baut 
logische Verknlipfungsstrukturen implementiert wer- 50 GemaB dem in Fig. 9 dargestellten ersten AusfQh- 
den kdnnen). rungsbeispiel ist — analog zur Anordnung der Zellen — 

Der Vollstandigkeit halber ist in Fig* 5 der Zellenauf- im Orthogonalraster eine Mehrzahl von integrierten 
bau eines 8-Bit-Addierers in seiner Gesaratheit darge- Schaltkreisen 20 angeordnet, deren jeweils benachbarte 
stellt Die in Fig. 5 gezeigte Struktur entspricht insoweit fiber lokale BUS-Leitungen 21 miteinander gekoppelt 
der nach Fig. 2, wobei die in Fig. 2 symbolisch als SUB- 55 beziehungsweise vernetzt sind Die — beispielsweise 
MACROS 2 dargestellten 1-Bit-Addierer jeweils durch aus sechzehn integrierten Schaltkreisen 20 bestehende 
eine vier-zellige Einheit 10.1 ... 10.4 ersetzt sind Bezo- - Rechnerstruktur weist Ein-ZAusgangsleitungen IO 
gen auf den erfindungsgemfiBen DatenfluBprozessor auf, flber die der Rechner quasi mit der AuBenwelt in 
bedeutet dies, daB zweiunddreiBig Zellen der zur Verfu- Verbindung steht, d h. korrespondiert Der Rechner ge- 
gung stehenden Gesamtheit von Zellen einer zellular 60 maB Fig. 9 weist ferner einen Speicher 22 auf, der dem 
mit logisch identischem Layout gefertigten Schaltungs- dargestellten Ausffihrungsbeispiel entsprechend aus 
platine seitens der Ladelogik so angesteuert und konfi- zwei separierten Speichern, zusammengesetzt aus je- 
guriert beziehungsweise programmiert werden, daB weils RAM, ROM sowie einem Dual-Ported RAM als 
diese zweiunddreiBig Zellen ein 8-Bit-Addierer bilden. shared memory zu der Ladelogik geschaltet, besteht, die 
In der Darstellung nach Fig. 5 ist fiber eine strich- 65 gleichermaBen als Schreib-Lese-Speicher oder auch nur 
punktierte Umrahmung ein SUBMACRO "X" zeichne- als Lese-Speicher realisiert sein konnen. Der soweit be- 
risch separiert, das letztlich als aus vier einem 1 -Bit- Ad- schriebenen Rechnerstruktur ist die Ladelogik 30 zu- 
dierer entsprechend programmierten Zellen (10 gemaB beziehungsweise ttbergeordnet, mittels der die inte- 
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grierten Schaltkreise (DatenfluBprozessor) 20 program- 
miert und konfiguriert und vernetzt werden. 

Die Ladelogik 30 baut auf einem Transputer 31, d h. 
einem Prozessor mit mikrocodiertem Befehlssatz auf, 
dem seinerseils ein Speicher 32 zugeordnet ist Die Ver- 
bindung zwischen dem Transputer 31 und dem Daten- 
fluBprozessor basiert auf einer Schnittstelle 33 fur die 
sogenannten Ladedaten, d. h. die Daten die den Daten- 
fluBprozessor aufgabenspeziflsch programmieren und 



die abzuspeichernden Additionsergebnisse erganzt. Die 
AdreBschaltung 46 besteht ihrerseits aus drei MACROs 
1 (gemaB Fig. 1) zur Bildung der AdreBdaten, wobei 
diese MACROs 1 wie folgt geschaltet sind: Ober jeweils 
einen Eingang werden die zu verknflpfenden Adressen 
fiir An, Bn, Cn zugefuhrt Diese Adressen werden mit 
den Ausgangssignalen eines Z&hlers 47 addiert und mit 
der Statemachine 45 so verknupft, dafi am Ausgang die 
neue Zieladresse ansteht Der Zahler 47 und der Kom- 



konfigurieren und einer Schnittstelle 34 fur den bereits io parator 48 haben dabei die Aufgabe sicherzustellen, daB 
genannten Rechnerspeicher 22, d h. den Shared-Memo- jeweils die richtigen Summanden verknupft werden und 
ry-Speicher. daB jeweils am Ende der Zahlenreihen, d. h. bei n =» 9 

Die in Fig. 9 dargestellte Struktur stellt so einen kom- abgebrochen wird Ist die Addition vollendet, so wird in 
pletten Rechner dar, der aber die Ladelogik 30 jeweils der Zeitsteuerung 45 ein STOP-Signal generiert und die 
fall- beziehungsweise aufgabenspeziflsch programmiert is Schaltung passiv geschaltet Ebenso kann das STOP-Si- 
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und konfiguriert werden kann. Der VollstSndigkeit hal 
ber sei noch angemerkt, daB — wie in Verbindung mit 
der Ladelogik 30 Qber Pfeile angedeutet — mehrere 
dieser Rechner vernetzt, dh. miteinander gekoppelt 
werden kdnnen. 

Ein weiteres Ausftihrungsbeispiel einer Rechner- 
struktur ist in Fig, 10 dargestellt Im Unterschied zu 
Fig. 9 sind dabei neben den lokalen BUS-Leitungen zwi- 
schen den benachbarten integrierten Schaltkreisen 20 
noch Obergeordnete zentrale BUS-Leitungen 23 vorge- 23 
sehen, urn zum Beispiel spezifische Ein- beziehungswei- 
se Ausgangsprobleme tosen zu k$nnen. Auch der Spei- 
cher 22 (Shared-Memory) ist liber zentrale BUS-Leitun- 
gen 23 mit den integrierten Schaltkreisen 20 verbunden, 
und zwar wie dargestellt jeweils mit Gruppen dieser 30 
integrierten Schaltkreise. Die in Fig. 10 dargestellte 
Rechnerstruktur weist die gleiche Ladelogik 30 auf, wie 
sie anhand von Fig, 9 erlautert wurde. 

In Verbindung mit Fig. 11a soil eine auf erfindungsge- 
maBen DatenfluBprozessoren aufgebaute Additions- 
schaltung erlautert werden. Ausgegangen wird von zwei 
Zahlenreihen An und Bn fUr s&mtliche n zwischen 0 und 
9; die Aufgabe besteht darin, die Surame Ci *» Ai -f Bi 
zu bilden, wobei der Index i die Werte 0 ■<= n < 9 anneh- 
men kann. 

Bezugnehmend auf die Darstellung nach Fig. 11a ist 
die Zahlenreihe An in einem ersten Speicher RAMI 
abgespeichert und zwar zum Beispiel ab einer Speicher* 
adresse lOOOh; die Zahlenreihe Bn ist in einem Speicher 
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gnal als Eingangssignal fur eine Synchronisations-Schal- 
tung verwendet werden, indem die Synchronisationslo- 
gik anhand dieses Signals erkennen kann, daB die Ge- 
samtfunktion "Addieren" gemaB dem nachfolgend be- 
schriebenen ML1 Programm beendet ist und die MA- 
CROS somit durch neue ersetzt werden kdnnen (zum 
Beispiel kdnnte STOP das Signal SyncS sein). 

Der Zeitablauf in der Zeitsteuerung 45 (STATEMA- 
CHINE) laBt sich dabei wie folgt darstellen, wobei noch 
anzumerken ist, daB in der Zeitsteuerung 45 eine Verzd- 
gerungszeit T (in Form von Taktzyklen) zwischen der 
AdreBgenerierung und dem Datenerhalt implementiert 
ist: 

— Im Zyklus 1 wird jeweils der Zahler 47 urn 1 
erhdht und im Komparator 48 wird geprQft, ob n > 
9 erreicht ist; synchron zu diesen Operationen wer- 
den die Adressen fur A, B, C berechnet; 

— im Zyklus (T+ 1) werden die Summanden A, B 
ausgelesen und addiert; 

— im Zyklus (T + 2) wird die Sunune C abgespei- 
chert 



Mit anderen Worten heiBt dies, daB die Operations- 
40 schleife und die eigentliche Addition gerade ( T + 2) 
Taktzyklen erfordert Im allgemeinen sind f Qr T 2 . . . 3 
Takte erforderlich, so daB verglichen mit den herkdmm- 
lichen Prozessoren (CPU), die im allgemeinen 50 bis 
mehrere 100 Taktzyklen bedingen, eine ganz wesentli- 



RAM2 an einer Speicheradresse OdfaOh abgespeichert; 45 che Rechenzeit-Reduzierung mdglich wird. 



Die anhand von Fig. 1 1 aufgezeigte {Configuration 
soli im folgenden Qber eine hypothetische MACRO- 
Sprache ML! nochmals erlautert werden: 
Es existieren die Zahlenreihen An und Bn 



die Summe Cn wird in den RAMI eingeschrieben und 
zwar unter der Adresse lOOah. 

Es ist ein weiterer Zahler 49 zugeschaltet, der ledig- 
lich die einzelnen durch die Steuerschaltung freigegebe- 
nen Taktzyklen hochzahlt Dies soil im Weiteren zur 50 
Verdeutlichung der Umkonfigurierbarkeit einzelner 
MACROs ohne Beeinflussung der an der Umkonfigurie- 
rung nicht beteiligten MACROs dienen. 

Fig. 11a zeigt zunachst die eigentliche Additions- 
schaltung 40, die aus einem ersten Register 41 zur Auf- 55 const n « 9; 
nahme der Zahlenreihe An und einem zweiten Register array A [n] in RAM [1] at lOOOh; 
42 zur Aufnahme der Zahlenreihe Bn besteht Den bei- array B [n] in RAM [2] at OdfaOh; 
den Registern 41/42 ist ein 8-Bit-Addierer entsprechend array C[n] in RAM [1] at lOOah; 
dem in Fig, 1 dargestellten MACRO 1 nachgeschaltet for i - 0 to n with (A [i] , B [i] , C [i]) 
Der Ausgang des MACRO 1 fahrt aber eine Treiber- w Al; 



Vn:0<= n <= 9 

Es sollen die Summen Ci « Ai + 
werden. 



Bi mit I e N gebildet 



schaltung 43 zuruck zum Speicher RAMI. Die Takt- 
beziehungsweise Zeitsteuerung der Additionsschaltung 
40 erfolgt iiber eine von einem Taktgenerator T ange- 
steuerte Zeitsteuerung (STATEMACHINE) 45, die mit 
den Registern 41, 42 und der Treiberschaltung 43 ver- 
bunden ist 

Die Additionsschaltung 40 wird f unktional durch eine 
AdreBschaltung 46 zur Generierung der AdreBdaten f Qr 



C « Al = A + B; 
next; 

RAMI ist der 1. Speicherblock 
RAM2 ist der 2, Speicherblock 
65 at folgt die Basisadresse der Arrays 
for ist der Schleifenbeginn 
next ist das Schleifenende 

with ( ) folgen die Variablen, deren Adressen durch die 
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Zahlvariable i bestimmt werden 

A T folgt die Verzdgerungszeit f Qr eine Statemachine in 

Taktzykien. 

Das Timing der Statemachine sieht demnach folgen- 
dermaBen aus: 5 

Zyklus Aktivitat 



T+ 1 
T + 2 



Zahlererh6hen,Verg]eichauf > 9G*a : 
Abbruch) und Adressen fOr A, B, C, 
berechnen 

A, B, holen und addieren 
Nach C speichern 
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ablaufs von 19 auf 29 hochiauft (Hiermit soli das dyna- 
mische unabhangige Umladen demonstriert werden, in 
jedem bisher bekannten Baustein wilrde der Zahier er- 
neut von 0 auf 9 lauf en, da er zuruckgesetzt wird). 

Bei naherer Betrachtung des Problems stellt sich die 
Frage, warum nicht beide Operationen, die Addition 
und die Multiplikation in einem ZykJus durchgefiihrt 
werden, also die Operation: 

Es existieren die Zahlenreihen An und Bn, wobei An 
durch das Ergebnis von Cn des vorher ausgefilhrten 
Programms gegeben ist: 



Vn:0«=n«=9 



is EssollendieProdukteCi«(Ai + Bi) 

Das heifit - wie bereits erwahnt — die Schleif e und die bildet werden. 

Addition bendtigen gerade einmal T + 2 Taktzykien. path D; 

Fig. lib zeigt den groben Aufbau der einzelnen const n- 9; 

Fuaktionen (MACROs) in einem DFR Die MACROs array A{nJ in RAM[ 1] at 1 OOOh 

sind in ihrer etwaigen Uge und GrSBe eingezeichnet 20 array B[nJ in RAM[2] at OdraOn 



Bi mit I e N ge- 



und mit den anhand von Fig. 11a erlauterten entspre- 
chenden Nummern versehen. 

Fig. 1 1c zeigt den groben Aufbau der einzelnen Funk- 
uonen auf die RAM-Blocke 1 und 2: Die Summanden 
werden nacheinander in aufsteigender Reihenfolge aus 25 
den RAM-Bldcken 1 und 2 ab Adresse lOOOh bezie- 
hungsweise OdfaOh gelesen und in RAM-Block 1 ab 
Adresse lOOah gespeichert Zudem sind die Zahier 47 
und 49 gegeben, beide zahlen wahrend des Ablaufs der 
Schaitung von Obis 9. 

Nach Beendigung des beschriebenen Programms soli 
ein neues Programm geladen werden, das die Ergebnis- 
se weiterverwertet Die Umladung soil zur Laufzeit er- 
folgen. Das Programm ist im Folgenden gegeben: 



Es existieren die Zahlenreihen An und Bn, wobei An 35 werden 



array C[n] in RAM[ 1] at lOOah 
f or i - 0 to n with ( A[i] , B[i] , C[i]) 
Al; 

D«=A1 «AbB; 
C«A1-D*B; 
next; 

path D definiert einen internen nicht aus den DFP 
herausgefiihrten Doppelpfad Die Operation benotigt 
wegen einem zusatzlichen Al einen Taktzyklus mehr als 
30 vorher, ist insgesamt jedoch schneiler als die beiden 
obigen Programme in Folge ausgeffihrt, da zum einen 
die Schleife nur einmal durchlaufen wird, zum zweiten 
nicht umgeladen wird. 
Prinzipiell konnte das Programm auch so formuliert 



const n-9; 

array A[n] in RAM[t]at lOOOh 
array B[n] in RAM[2] at OdfaOh 
array C[n] in RAM[i] at lOOah 
40 for i-0 ton with (A[i],B[iiqi]) 
A-l; 

C«A2«o(A + B)*B; 
next; 

Sind die Gatterlaufzeiten des Addierers und des Mul- 
45 tiplizierers zusammen kieiner als ein Taktzyklus, kann 
die Operation (A + B) • B auch in einem Taktzyklus 
durchgefOhrt werden, was zu einer weiteren erhebli- 
chen Geschwindigkeitssteigerung fuhrt; 
const n« 9; 
50 arrayA[n]inRAM[l]at lOOOh 
array B[n] in RAM[2] at OdfaOh 
array C[n] in RAM[1] at lOOah 
for i « 0 to n with (A[iJ B[iJ Qi]) 
Al; 

55 C=A1«(A + B)»B; 

next; . . , 

Anhand von Fig. 12 soli ein einfaches Beispiel eines 
Zellenaufbaus erlautert werden. Die Zelle 10 umfaBt 
zu ACMierer 1 aus fig. no- in rig. iou i« cnmu ui C zum Beispiel ein UND-Glied 51, ein ODER-Glied 52, ein 
Auswirkung der Funktion auf den Speicher aufgezeigt, eo XOR-Glied 53, einen Inverter 54 sowie erne Register- 
Zahler 47 zahlt emeut von 0 bis 9, d. h. er wird beim zelle 55. Die Zelle 10 weist darflberhinaus euigangsseittg 
Nachladen der MACROs zuruckgesetzt zwei Multiplexer 56, 57 mit .(den sec hzehn &o£og en 

Besonders zu beachten ist der Zahier 49. Angenom- der Zelle entsprechend Fig. 6) zum Beispielje sechzehn 
men, das Umladen der MACROs betragt 10 Taktzykien. EingangsanschlQssen INI, IN2 auf. UDer diesen 
Dann lauft der Ziihler 49 von 9 auf 19, da der Baustein 6 5 (16 : l>Multiplexer 56/57 werden jewel* den ge- 
dynamisch umgeladen wird, d. h. nur die umzuladenden nannten logischen Gliedern UND, ODEK, 51 . . . 
Telle werden gestoppt, der Rest arbeitet weiter. Das 53 zuzufiihrenden Daten ausgew&hlt Diese logischen 
fuhrt nun dazu, daB der Zahier wahrend des Programm- Glieder sind ausgangsseitig mit einem (3 : i;-Mumpie- 



durch das Ergebnis Cn des vorher ausgefuhrten Pro- 
gramms gegeben ist: 

Es sollen die Produkte Ci— Ai* Bi mit I G N gebildet 

werden. 

const n*= 9 

array A[n] in RAM[1] at lOOah 
array B[n] in RAM[2] at OdfaOh 
array C[n] in RAM[1] at 10l5h 
for i « 0 to n with (A[i] , Bp] t c[i]) 
Al; 

C- A1-A*B; 
next; 

Die Beschreibung der einzelnen Befehle ist bereits be- 
kannt, 

* symbolisiert die Multiplikation. 

Die MACRO-Struktur ist in Fig. 18a beschrieben, 
Fig. 18b gibt in bekannter Weise die Lage und Gr6Be 
der einzelnen MACROs auf dem Chip an, besonders zu 
beachten ist die Grfifie des Multiplizierers 2 in Vergleich 
zu Addierer 1 aus Fig. lib. In Fig. 18c ist emeut die 
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xer 58 gekoppelt der seinerseits mit dem Eingang des 
Inverters 54, einem Eingang der Registerzelle 55 und 
cinem weiteren (3 : 16)-Multiplexer 59 gekoppelt ist 
Der letztgenannte Multiplexer 59 ist zusltzlich mit dem 
Ausgang des Inverters 54 und einem Ausgang der Regi- 5 
sterzelle 55 verbunden und gibt das Ausgangssignal 
OUTab. 

Der Voilstandigkeit halber sei angemerkt daB die Re- 
gisterzelle 55 mit einem Reset-Eingang R und einem 
Takteingang gekoppelt ist 10 

Dem im vorstehenden erlauterten Zellenaufbau, d. h. 
der Zelle 10 ist nun eine Ladelogik 30 Qbergeordnet, die 
mit den Multiplexern 56, 57, 58 und 59 verbunden ist und 
diese den gewUnschten Funktionen entsprechend an- 
steuert 15 

Sollen zum Beispiel die Signale A2 mit B5 verundet 
werden, so werden die Multiplexer 56, 57 den Leitungen 
"ZWEF beziehungsweise TONF* entsprechend aktiv 
geschaltet; die Summanden gelangen dann zum UND- 
Glied 51 und werden bei entsprechender Aktivierung 20 
der Multiplexer 58, 59 am Ausgang OUT abgegeben. 
Soli zum Beispiel eine NAND-VerknQpfung durchge- 
fuhrt werden, so schaltet der Multiplexer 58 zum Inver- 
ter 54 und am Ausgang OUT steht dann das negierte 
UND-Ergebnis an. 25 

Patentansprtiche 

1. Datenverarbeitungseinrichtung, wobei ein (im 
folgenden DatenfluBprozessor — DFP — genann- 30 
ter) integrierter Schaltungskreis (Chip) mit einer 
Vielzahl insbesondere orthogonal zueinander an- 
geordneter homogen strukturierter Zellen mit je 
einer Mehrzahi jeweils logisch gleicher und struk- 
turell identisch angeordneter Bausteine vorgese- as 
hen ist, dessen Zellen zeilen- und spaltenweise, ge- 
gebenenfalls gruppenweise zusammengefaBt mit 
EuWAusgangsanschlflssen des integrierten Schalt- 
kreises verbunden sind, dadurch gekennzeichnet, 
daB den Zellen eine Ladelogik zugeordnet ist, fiber 40 
die sie je filr sich und gegebenenfalls gruppenweise 
zusammengefaBt so programmierbar (konfigurier- 
bar) sind, daB beliebige logische Funktionen und/ 
oder Vernetzungen untereinander verifizierbar 
sind, und zwar derart daB eine Manipulation der 45 
DFP-Konfiguration wahrend des Betriebes (oder 
zur Laufzeit), d. h. die Modifikation funktioneller 
Teile (MACROS) des DFPs erfolgen kann, ohne 
daB andere funktionelle Teile angehalten werden 
mOssen oder in ihrer Funktion beeintrachtigt wer- 50 
den. 

2. Datenverarbeitungseinrichtungnach Anspruch 1, 
dadurch gekennzeichnet daB die Ladelogik mit 
Speichermitteln gekoppelt ist, fiber die die Konfr- 
guration der Zellen spezifizierbar ist 55 

3. Datenverarbeitungseinrichtung nach einem der 
Anspruche 1 bis % dadurch gekennzeichnet, daB die 
Ladelogik aus einem Prozessor besteht, der den 
gesamten Programmablauf auf der Grundlage von 

in verschiedenen Speichern abgelegten Daten und so 
Programmen im Sinne einer Harvard-Struktur ver- 
waltet 

4. Datenverarbeitungseinrichtung nach Anspruch 3, 
dadurch gekennzeichnet, daB die Ladelogik ihrer- 
seits aus Zellen mit je einer Mehrzahi jeweils lo- 65 
gisch gleicher und strukturell identisch angeordne- 
ter Bausteine aufgebaut ist 

5. Datenverarbeitungseinrichtung nach einem der 
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Anspruche 1 oder 4, dadurch gekennzeichnet daB 
die Zellen dynamisch wahrend eines Programmab- 
laufs umkonfigurierbar sind, ohne daB die zu bear- 
beitenden Daten selbst beeinfluBt werden. 

6. Datenverarbeitungseinrichtung, wobei ein (im 
folgenden DatenfluBprozessor — DFP — genann- 
ter) integrierter Schaltungskreis (Chip) mit einer 
Vielzahl insbesondere orthogonal zueinander an- 
geordneter homogen strukturierter Zellen mit je 
einer Mehrzahi jeweils logisch gleicher und struk- 
turell identisch angeordneter Bausteine vorgese- 
hen ist dessen Zellen zeilen- und spaltenweise, ge- 
gebenenfalls gruppenweise zusammengefaBt, mit 
EuWAusgangsanschlQssen des integrierten Schalt- 
kreises verbunden sind, dadurch gekennzeichnet 
daB eine Mehrzahi von ihnen in Kaskadenform 
koppelbar sind. 

7. Datenverarbeitungseinrichtung nach einem der 
Anspruche 1 bis 6, gekennzeichnet durch, die Zu- 
ordnung geeigneter Daten-Ein-/Ausgabe-Einhei- 
ten und mindestens eines Speichers zum Aufbau 
eines (komplexen, kompletten) Rechenwerks. 

8. Datenverarbeitungseinrichtung nach einem der 
Anspruche \ bis 7, dadurch gekennzeichnet daB die 
Funktionen der Ein-/Ausgabeeinheiten partiell im 
integrierten Schaltkreis (Chip) implementierbar 
sind. 
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